精彩回顾 | “Python数据爬取和文本分析案例实操”+学霸笔记!
会计学术联盟(ID:KJXSLM)
——为高端财会人的智慧成长赋能
传播会计前辈思想,引领青年一代成长
因缘分相聚,因互助成长,因智慧光华
建 议 盟 友| 星 标 我 们
不再遗憾错过 ☆ 每次成长机会
今日暑期训练营关注
★ 2022优秀会计学子训练营 ★
01
课程回顾
✦
7月5日晚7点,由舍得老师主讲Python数据爬取和案例实操。
课程开始前,由浙江财经大学硕士研究生张宁主持,向大家介绍舍得老师是管理学(会计学)博士,目前主持教育部人文科学基金一项,国家自然科学基金一项,主要研究方向为政府与非营利组织会计、财务会计理论。科研成果多发表于China Journal of Accounting Research(CJAR)、《经济研究》、《世界经济》、《金融研究》、《审计研究》、《管理科学》、《经济管理》等顶级期刊。
相信大家对前两天舍得老师的课程——CSSCI论文Stata复制案例的学习还意犹未尽,那么今天,舍得老师又要为我们讲授《Python数据爬取和案例实操》课程。各位小伙伴在听课过程中如有任何疑问,可以在聊天区点开助教小伙伴的问题搜集链接,把疑问写在表单里,课后老师会为大家一一解答!那接下来,就有请舍得老师及其团队成员蔡博士为我们开启正式的课程吧!欢迎老师!课程开始,舍得老师表示学习Python可以通过多种途径,这个软件的内容也很多,但是要学会以不变应万变,在会计学中应用到这个软件大概分为3个模块即爬取网页文本信息、文本分析指标的构建、文本之间关系的度量。
首先需要安装两个有效的工具来作为本次课程需要用到的软件,Python和Pycharm,舍得老师形象的比喻了两者关系就相当于QQ和QQ皮肤,还指出Python的三大特点是伪代码、易学、免费+开源,Pycharm的两个特点即最顺手、最好用的编辑器,舍得老师还亲自带学子们安装了这2个软件。
本期课程主要分为三个模块,模块一、爬取网页文本信息;模块二、文本分析指标的构建;模块三、文本之间关系的度量。
模块一、爬取网页文本信息
先由舍得老师团队成员之一的蔡博士给我们讲解爬取公司年度报告。蔡博士给我们详细演示并讲解了如何增加、导入新的命令包、巨潮网开发者网页分析,分析网页所需的函数、表单数据、向页面发出请求、调用函数下载等命令;舍得老师在蔡博士基础上讲解了运行中出现的错误,告诉同学们应该如何应对,随后介绍了如何爬取社会责任报告,社会责任报告爬取网页遇到的问题应该如何解决,舍得老师手把手带同学们运行,使同学们加深了对Python认识。
模块二、文本分析指标的构建
舍得老师向我们介绍了当前公司信息披露质量的常见测量技术,然后蔡博士介绍用Python如何计算热门词频,其中涉及到docx、jieba、panda、math等工具包,以北京市政府报告介绍了高频词统计,以政府工作报告“民生慈善”为例利用Python计算特定词频,以政府工作报告为例利用Python分析其中的正负面情感分析,以政府工作报告的遣词造句的生僻字来分析可读性;舍得老师以公司环保“多言寡行”为例利用STATA介绍如何进行词频统计,形成词典便于明晰概念,包括destring和tostring命令、文本分段与合并命令、global、foreach、moss、临界值的设置、cap drop等。又讲解了根据管理层词频统计的分析出语音语调,用新华字典的生僻词来分析公司年报的可读性。
模块三、文本之间关系的度量
蔡博士首先介绍Jaccard相似系数就是交集词数除以并集次数,Simhash是去重的算法,可以解决friendly和friend相似,在用Python之前要把这两个命令包导入,并以政府工作报告的创新表达为例,演示了如何计算重复性/创新性。舍得老师表示Stata的isemantica命令也可以做到度量文本之间的关系,从余弦相似度这一命令讲解并详细给我们演示了如何操作。
最后,舍得老师用一幅图来指出,今天的内容命令都很相似,同学们要以不变应万变,在之前的基础上不断总结摸索,希望同学们能用这个模板继续改,继续深入,学以致用,再次感谢舍得老师的分享。
02
学霸笔记
✦
03
学习心得
✦
训练营有回放,教师/学子现在通过社会通道,仍可报名
详情请扫上方图片二维码咨询。
2022优秀会计学子暑期训练营第十二天(19:00-22:00)
课
程
预
告
讲座提纲
《案例研究与写作技巧─以获奖优秀案例为例》
1、会计案例研究概述
2、专业案例写作技巧
3、获奖案例实践分享
嘉宾介绍
石水平,会计学博士,暨南大学管理学院会计学系教授,硕士研究生导师,国际注册反舞弊师。中国企业反舞弊联盟专家委员、广东省管理会计师协会专家委员、广东省企业内部控制协会专家委员,广东省社会组织评估专家、广东省信息系统审计专业委员会委员、广州市审计学会常务理事、广州市民政局慈善信托评估委员会专家委员,教育部学位论文抽查、全国优秀专业学位案例和基金项目通讯评审专家,兼任多家上市公司独立董事。毕业于中山大学,美国波士顿大学和香港城市大学访问学者,曾荣获财政部“杨纪琬会计学奖”、“广东省哲学社会科学优秀成果奖”、“MPAcc全国优秀教学案例奖”、“MAud全国优秀教学案例奖”、“ACCA全国优秀指导教师”和“海峡两岸大学会计辩论邀请赛优秀指导老师”。
主持国家自然科学基金重点项目子课题、国家社会科学基金青年项目、广东省软科学重点项目、广东省自然科学基金项目、广东省社会科学基金项目和广东省专业学位教学案例库建设项目共6项,参与近10项国家及省部级课题研究。在Journal of Environmental Protection and Ecology、《金融研究》、《经济学动态》、《财经研究》、《管理科学》等国内外重要期刊上发表学术论文40余篇,独立和参与出版专著6部,担任China Finance Review International、《会计研究》、《中国管理科学》、《南开管理评论》、《财贸研究》、《暨南学报》、《南方经济》和《管理学季刊》等期刊匿名审稿人。
2022年暑期科研训练营精彩回顾
精彩回顾 | “SSCI论文Stata复制案例(2)”+学霸笔记!
精彩回顾 | “CSSCI论文Stata复制案例”+学霸笔记!精彩回顾 | “Stata与计量经济学概览之四”+学霸笔记!精彩回顾 | “Stata与计量经济学概览之三”+学霸笔记!精彩回顾 | “Stata与计量经济学概览之二”+学霸笔记!精彩回顾 | “Stata与计量经济学概览之一”+学霸笔记!精彩回顾 | “实证研究方法论:写作视角”+学霸笔记!精彩回顾 | “如何开始一个实证研究”+学霸笔记!精彩回顾 | “规范会计研究及方法论”+学霸笔记!精彩回顾 | “会计案例研究与写作”+学霸笔记!
本期助教团
主持 张宁 浙江财经大学 硕士生
统筹策划:徐晓东 吉林财经大学 硕士生
朵朵 西南大学 博士
张清燕 石河子大学 博士生
推文编辑:张馨月 广州华商学院 助教
文案撰写:单佩佩 信阳师范学院 硕士生
图频素材:王荇 郑州轻工业大学 硕士生
策 划: 张宁 浙江财经大学 硕士生
臧嘉烨 东北财经大学 硕士生
资料对接:朵朵 西南大学 博士
直播技术:宋志玮 北京印刷学院 硕士生
陈浩填 广东外语外贸大学 硕士生
答疑收集:徐梦 哈尔滨工程大学 博士生
张梦瑶 河南财经政法大学 本科生
学子考核:周萌 华北水利水电大学 硕士生
学子计划:张佩 石河子大学 博士生
详情扫码或请点击阅读原文。
打包学习更实惠
建议先咨询好再报名
"导师组名单"
曲晓辉 厦门大学/哈工大(深圳)教授/博导
蔡 春 西南财经大学 教授/博导
田高良 西安交通大学 教授/博导
孔东民 华中科大/中南财大 教授/博导
步丹璐 西南财经大学 教授/博导
刘 行 东北财经大学 教授/博导
邓 路 北京航空航天大学 教授/博导
杨忠海 哈尔滨工程大学 教授/博导
吴昊旻 云南财经大学 教授/博导
黄宏斌 天津财经大学 教授/博导
廖 林 南京审计大学 副教授/博导
王 凯 首都经贸大学 副教授/博导
石水平 暨南大学 博士/教授
李万福 南京财经大学 博士/教授
钟廷勇 重庆工商大学 博士/教授
郑登元 南京审计大学 博士/教授
龙文滨 广东外语外贸大学 博士/教授
韩 跃 山东财经大学 博士/副教授
汤晓建 南京农业大学 博士/副教授
王 雷 兰州大学 博士/副教授
谭文浩 南京财经大学 博士/副教授
李 哲 中央财经大学 博士/副教授
于 博 天津财经大学 博士/副教授
黄 灿 广东工业大学 博士/副教授
林晚发 武汉大学 博士/副教授
Kevin Huang 卧龙岗大学 博士
丁 鑫 东北林业大学 博士/副教授
顾 俊 深圳大学 博士
傅绍正 天津财经大学 博士/副教授
黄贤环 山西财经大学 博士/副教授
金 宇 天津财经大学 博士
会计学术联盟
会计学术联盟学术服务委员会
会计学术联盟学术指导委员会
会计学术联盟学术顾问委员会
优秀会计学子成长训练营组委会
2022年6月16日
点击上图链接,查看联合发起单位名单WINTER
关注会计学术联盟
为财会人智慧成长赋能
近18万高端财会人关注
前沿.会议.招聘.本硕博